從廣告系畢業後到澳洲學餐飲,待過早午餐也待過一帽餐廳(澳洲米其林一星),投身餐飲將近7年。去年開始左手拿鍋,右手敲excel,利用下班投入線上課程自學一年後,成攻轉職數據分析。
終端機(Terminal):
可直接控制整台電腦系統和執行操作的文字介面,如運行 Docker 命令、Python 腳本等。
Python:
一種跟電腦溝通的通用語言,特別適合數據處理和分析。Python提供邏輯與方法,終端機則像下命令的指揮部。
SQL:
數據庫查詢語言。能從數據庫中查詢、操作和分析數據。
BigQuery:
Google 的雲端倉儲,可將資料存入,並用SQL來與之互動。可以想像成大型有規模的Excel。
Airflow:
當今天你有固定的流程需要自動運作時,可以透過AirFlow幫你安排。
Docker:
創建獨立的運行環境(容器),讓做這個專案的時候環境一致。相信我,最挫折的都不是程式邏輯怎麼寫,而是環境及版本打架,你不知道該從哪裡解決。
終端機用來運行系統,包括啟動 Airflow 和建立Docker...等。
然後用Python 編寫 Airflow DAGs、爬蟲腳本甚至是SQL用在Bigquery中的指令,上述都是Python可以寫的邏輯與方法。
Airflow 可以按照設定的時間表運行 Python 腳本,執行數據爬取、處理,然後將結果存入 BigQuery。
Docker將整個Airflow的流程打包起來在一個獨立容器中,避免被專案無關的東西干擾及影響。
接下來來看一些基本的工具知識吧,從認識python的常用語法開始!